Fermes de contenus : comment Google peut les reconnaître ?
Il y a quelques jours nous apprenions le lancement de l’extension Personal Blocklist pour le navigateur Chrome. Quel est le but ? Bloquer les fermes de contenus. L’annonce de Matt Cutts et d’Amit Singhal publiée vendredi 26 février 2011 sur le blog officiel de Google n’est pas passée inaperçue, une évolution d’algorithmes du moteur de recherche aura (a eu) pour conséquence de pénaliser les fermes de contenus. Cette mise à jour du moteur devrait affecter près de 12% des résultats de recherche de Google.com. Le but de Google est clair : présenter rapidement des résultats de recherche pertinents.
Une nouvelle mise à jour, vraiment nouvelle ?
Google nous incite-t-il à spammer et à pourrir ses résultats de recherche ? Assurément non, c’est plutôt le travail du spammeur. Ce qui était vu comme une nouvelle n’en est pas vraiment une, ces fermes sont dans le collimateur de Google depuis longtemps. Aujourd’hui les décideurs, instigateurs de ce business model en France, sont sur le qui-vive.
Face au problème ils ont plusieurs solutions :
- attendre bêtement l’impact de la comète Google,
- faire dans le qualitatif,
- stopper les duplications de contenus parce que le contenu – de qualité – est roi,
- pencher vers une stratégie de linkbaiting (ça fonctionne toujours contrairement aux sales méthodes de référencement).
Les fermes de contenus en France.
En France quelles sont les fermes de contenus visées par Google ? Cette question a rarement été soulevée. Google ne donne pas les critères qui nous permettraient de reconnaître une ferme de contenus si bien que les internautes pourraient bloquer des sites de manière arbitraire.
Aux États-Unis il y a par exemple le site eHow, voyez le type de pages qu’ils proposent : How to Celebrate Chinese New Year. Pour la France des blogueurs et webmasters citent les sites Suite101.fr, Les-Experts.com (de Wikio Group) ou Wikipédia comme exemples de fermes de contenus. Je vais être plus clair et vous dire comment reconnaître une ferme de contenus.
- Ce sont des plateformes qui publient quotidiennement un nombre considérable d’articles. Ces sites contiennent un nombre de pages considérable (des millions).
- Elles sont construites sur la base d’un business model : le contenu à la demande.
- Ces plateformes publient des articles sur des sujets (de secteurs d’activité variés) très différents.
- Sans parler du type des liens et de la provenance multiple de ces liens le taux d’acquisition de liens entrants – naturels – est lacunaire.
- Les auteurs de ces articles obtiennent un revenu dérisoire (5 à 10€ par articles), certains le justifient comme une activité complémentaire, un travail qui permet d’arrondir les fins de mois.
- Ces contenus contiennent une forte densité de mots clés ciblés. Ils font des répétitions de mots clés, évitent les synonymes.
- Ils traitent de sujets très demandés par les internautes.
- Ce ne sont pas des contenus informatifs. Selon Frédéric Montagnon les fermes de contenus produisent de la quantité au détriment de la qualité. Le Président d’OverBlog et Directeur Marketing de Wikio Group défend Les-Experts.com en affirmant que la plateforme privilégie la création d’articles de qualité (source: JDN).
- Les contenus publient souvent des listes à puces sans approfondir le sujet qu’ils traitent. Les contenus sont superficiels (voir les articles d’eHow.com).
- Les pages de ces contenus sont chargées de publicité Google AdSense. Dans le forum News.ycombinator.com un googler appelé « Moultano » déclarait (début février 2011) qu’un grand changement allait venir. Il disait notamment que la présence d’AdSense sur un site pouvait heurter le classement des pages dans les SERPs (voir lien en fin d’article).
- Les contenus ne disposent pas de liens sortants et s’ils existent ils sont en no-follow.
- Les contenus n’affichent pas l’identité des auteurs, il y a par exemple : « Par un contributeur d’eHow ».
Nous ne pouvons pas isoler chaque critère de cet ensemble qui mériterait bien d’être alimenté. N’hésitez pas à intervenir.
Je vais terminer ce billet par deux questions. Comment Google détermine un contenu de haute qualité ? Le critère de subjectivité y a certainement une part.
Par ailleurs, malgré les nombreuses plaintes d’utilisateurs est-ce vraiment la qualité de contenus qui est visée par Google ? N’est-ce pas un business model ? Les résultats de recherche de Google ne sont-ils pas, eux-mêmes, une gigantesque ferme de contenus (créés gratuitement) ?
Liens connexes :
- Finding more high-quality sites in search.
- JournalDuNet : interview Frédéric Montagnon.
- Liste de fermes de contenus qui seraient déjà pénalisés.
- La présence d’AdSense : un signal négatif (Moultano dans Ycombinator.com).
Frederic Montagnon
27 février 2011 15 h 45 minJe trouve le débat mal posé, et je suis surpris que Google ne le repositionne pas. La façon dont Google communique en ce moment est vraiment très politique… On est loin du Google créé par ces deux jeunes impertinents dans un garage 🙂
La question est pour moi: comment reconnaitre des contenus pertinents pour les utilisateurs qui se servent de Google. Peu importe qui les créent. Peu importe comment ils sont créés.
Si Google se met à trier des types de sites, je pense que cela marque la fin de son modèle…
Audiofeeline
4 mars 2011 11 h 31 minLe fait est que les éditeurs de sites ne savent pas tous qu’ils produisent des “fermes de contenus”. Par ailleurs ces sites répondent à une demande, une information concise qui va à l’essentiel.
Je crois aussi que ce nouvel algorithme va aussi déclasser des sites légitimes. Produire du contenu en masse n’est pas réellement néfaste se selon moi d’autant que les articles qui obtiennent des liens (et qui se positionnent bien) sont très souvent les plus pertinents.
Très honnêtement je suis très mitigé sur ce changement de politique. J’ajouterais que si ces articles ne convenaient pas aux utilisateurs ils auraient un très fort taux de rebond et seraient en toute logique déclassés.
Je ne vois pas trop l’intérêt de cette modification si ce n’est vendre plus d’AdWords…
Jean-Baptiste
15 mars 2011 7 h 33 minEst-ce que, selon toi, on peut assimiler les comparateurs de prix sauvages à une ferme de contenu ? Ils regroupent plusieurs des indices listés ci-dessus, même si le lien sortant existe ?
Aisne Numérique
22 juillet 2011 17 h 16 minLa présence de liens nofollow était déjà souvent contre productive.
Si en plus il y a un risque de déclassement, cette balise va devenir difficile à utiliser.
En ce qui me concerne je vais commencer à la retirer dès maintenant.
ya-graphic
22 juillet 2011 17 h 26 minLe nofollow doit être utilisé intelligemment. J’avais publié un article à ce propos : Comment utiliser le nofollow ?